查看原文
其他

生成式AI手机长什么样?

徐豫 新皮层NewNewThing 2024-03-08

实习记者:徐    豫
编辑:吴洋

Key Points


Galaxy S24是全球首款生成式AI手机,搭载Gemini Nano;


和微软的Copilot类似,Galaxy S24的AI功能也是操作系统级的;


Galaxy S24的Home键成为生成式AI的一大功能入口。


所有硬件厂商都在思考如何为生成式AI设计一款硬件的时候,三星先将大模型——Google的Gemini Nano放进了最新款手机里。
北京时间1月18日凌晨,三星在美国加州举办发布会,发布全球首款生成式AI手机Galaxy S24。这款手机可以在用户打电话的过程中完成实时翻译,还能以「生成」的方式修图,同时,它有一个实体AI键——Home键,背后的支持模型就是Gemini。

发布会主题叫「开启移动AI的新时代」,意思是生成式AI来到手机了。

整场发布会一小时十分钟,Google平台与生态系统高级副总裁Hiroshi Lockheimer的演讲就持续了约20分钟,中途打开直播的人可能会误以为这是Google的发布会。不过这种「结盟」现象你应该已经见过了,去年11月7日的OpenAI开发者大会上,微软CEO纳德拉同样出现并与OpenAI CEO Sam Altman聊了会儿天。三星手机如今在中国已经没什么存在感了,其市场份额跌到了1%左右,但是,让大模型在手机这样的小型设备中运行,Galaxy S24抢到了业界的里程碑。此前,大模型对算力的要求使其只能部署在算力庞大的云端。通过三星Galaxy S24,Google展示了让大模型跑在手机上会是什么样,不过它展现出来的功能似乎不多。

通话实时翻译

相较于市面上需要口头或手动录入谈话内容的翻译软件,三星Galaxy S24能够在通话时提供实时双向语音翻译,并且可同步在手机界面上显示原文和译文,即便对方使用的不是Galaxy S24。

比如,当英语使用者Heejin想约西班牙语使用者Esmeralda共进晚餐,Heejin用英文输入并发送「明晚7点有空去吃晚餐吗」,西班牙语翻译和英语原文会同步出现在输入框和对话框;Esmeralda直接用西班牙语回答「7点正合适,我已经迫不及待想和你见面了」,其英文翻译也会实时展现给Heejin。

通话过程中不用操作手机,只需要在一开始设置好通话语言就可以。

目前,该「24小时私人翻译」可以任意转换13种常用语言,覆盖英语、汉语、西班牙语、韩语、法语、德语、印地语、意大利语、日语、波兰语、葡萄牙语、泰语和越南语。

Circle to Search

聊天、浏览社交媒体,甚至查看PPT文档时,只要你对屏幕上的任何内容有进一步了解的意愿,都可以伸出手指、圈中它,按下Home键——相当于一键召唤Google,无需切换应用程序,Galaxy S24能即时给出相应的搜索结果。
比如你正在浏览一张身着橙色高筒靴的模特的照片,好奇模特穿的靴子的品牌或价格。过去,你需要截屏、退出当前应用、切换至购物App按图片检索,才能获得相应结果。Galaxy S24的「Circle to Search」功能不需要切换任何应用程序。

图片、网页、屏幕、聊天过程中……一切皆可先圈住(Circle),再用生成式AI搜索。

三星Galaxy S24的实时翻译、「Circle to Search」功能都基于Google去年12月发布的Gemini Nano大模型。Gemini系列模型包括Nano、Pro、Ultra 3个版本,Gemini Nano是其中最小的版本,适用于移动设备,比如手机。Gemini Pro适合个人电脑,而Ultra版本的Gemini须部署在有庞大算力的云端数据中心。

生成式修图

「Circle」这个动作还被用于三星Galaxy S24系列的AI图片编辑。发布会现场演示的操作中,一位全身篮球行头的男子原地起跳准备扣篮,演示者「Circle」该男子后,男子就在图像中被「抠出来」,只需移动抠图,男子在图像中的位置就从距离篮框很远的地方被移动至篮框旁边,而整张图的背景可以被AI生成的像素即时补全。并且,Galaxy S24可以在AI的帮助下为视频插入帧,从而将常规视频转换为慢动作。

人物抠出后,背景是重新生成的。

这些功能与Adobe去年5月在Photoshop中推出的「生成式填色」(Generative Fill)功能相似,只不过Galaxy S24的AI修图尚未提供「根据文字描述生成图像」功能,而Photoshop的「生成式填色」允许用户选中图像中的某个区域,用文字描述想要新增或取代的物件、背景,其背后AI就能为相应区域生成用户描述的物体或背景。

指环来了

在发布会的尾声时,三星卖了个关子,透露公司正在研发一款名为「Galaxy Ring」的智能戒指。三星将其视为「功能强大且易于使用」的健康和保健设备,但尚未公开上市时间、价格等消息。
2023年,三星申请了一项智能环专利,该工具预期提供心电图和智能家居控制功能。按计划,Samsung Health将与Galaxy生态系统合作,于今年晚些时候推出全新的智能健康服务,参考指标建立在对用户的睡眠、活动、静息心率和心率变异性的测量之上。

指环预计今年发布。

Galaxy S24系列共有3款,分别是Galaxy S24、Galaxy S24 Plus和Galaxy S24 Ultra,售价为799.99美元、999.99美元和1299.99美元,即日起接受预订。在手机行业,三星全球销量冠军的位置刚刚被苹果拿走。IDC的数据显示,2023年苹果手机出货量2.346亿部,市场份额超过20%;三星出货量2.266亿部,市场份额为19.4%。而在生成式AI领域,Google正在努力追赶OpenAI的模型水平。进入更多端侧设备、成为系统级AI是Google的核心策略之一。三星Galaxy S24可以被视作Google端侧AI战略的样板,此外,Google旗下自有手机品牌Pixel也将于1月31日起上线类似的生成式AI功能。目前,OpenAI还没有针对手机这样的小型设备推出可以在本地运行的模型,其GPT-4模型进入的最小端侧设备是个人电脑,比如Copilot,它由OpenAI的投资者微软基于GPT-4推出。三星发布Galaxy S24前半个月,微软刚刚宣布要在搭载Windows系统的电脑上安装一个名为「Copilot」的实体按键,位置就在右侧Alt键的右边。有了该按键,用户同样可以一键唤出AI——只不过响应的大模型不是Gemini,而是GPT-4。Google大模型的目标是安卓系的移动终端,而微软的目标是Windows系的桌面终端。


-END-

定制你自己的ChatGPT

CES进行时|这几个产品有点意思

继续滑动看下一个

生成式AI手机长什么样?

徐豫 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存